跟着Nature学作图:R语言ggplot2箱线图/堆积柱形图完整示例

论文

Graph pangenome captures missing heritability and empowers tomato breeding

https://www.nature.com/articles/s41586-022-04808-9#MOESM8

没有找到论文里的作图的代码,但是找到了部分组图数据,我们可以用论文中提供的原始数据模仿出论文中的图

今天的推文重复一下论文中的 Extended Data Fig7b Extended Data Fig7c 箱线图和堆积柱形图

image.png

箱线图下方的8个矩形可以用拼图的方式来实现

箱线图的部分示例数据

image.png

这里并没有提供箱线图的分组数据,这里我自己随便构造一列分组数据了,所以最终结果可能和原图不一致

整理数据

library(readxl)
dat01<-read_excel("data/20220711/41586_2022_4808_MOESM10_ESM.xlsx",
                  sheet = "Extend Fig7b",
                  skip = 1)
head(dat01)

library(tidyverse)

dat01 %>% 
  mutate(group_info=sample(c(rep("A",313),
                             rep("B",5),
                             rep("C",8),
                             rep("D",6)),
                           332,
                           replace = FALSE)) -> efig7c

箱线图代码

library(ggplot2)
library(latex2exp)
help(package="latex2exp")
dat<-data.frame(x=c(0.5,1:4),
                y=-Inf,
                label=c("n=",313,5,8,5))

ggplot(data=efig7c,
       aes(x=group_info,y=BLUP))+
  geom_boxplot(aes(fill=group_info))+
  scale_fill_manual(values = c("#feb2a9","#fdd79d",
                               "#dbcde4","#c993c7"))+
  geom_jitter(width = 0.4)+
  theme_bw()+
  theme(panel.grid = element_blank())+
  annotate(geom = "text",
           x=4,y=Inf,
           label=TeX(r"(Kruskal Wallis, \textit{P} = 5 \times 10${^-}$${^7}$)"),
           vjust=1,hjust=1)+
  geom_text(data=dat,aes(x=x,y=y,label=label),
            inherit.aes = FALSE,
            vjust=-0.8)+
  ylim(-40,NA)+
  labs(y="BLUP value of expression")+
  theme(axis.title.x = element_blank(),
        axis.text.x = element_blank(),
        legend.position = "none") -> p1
p1
image.png

箱线图下方的矩形点

dat.2<-data.frame(x=rep(LETTERS[1:4],2),
                  y=rep(c(1,2),each=4),
                  group=c("A","A","A","D","A","B","D","A"))
dat.2

ggplot(data=dat.2,aes(x=x,y=y,fill=group,color=group))+
  geom_point(shape=22,size=5)+
  scale_fill_manual(values = c("#fc8072","#a1d99b",
                               "#4192c6"),
                    labels=c("Reference homozygous",
                             "Heterozygous",
                             "Alternate homozygous"))+
  scale_color_manual(values = c("#fc8072","#a1d99b",
                               "#4192c6"),
                     labels=c("Reference homozygous",
                              "Heterozygous",
                              "Alternate homozygous"))+
  theme_void() +
  theme(legend.title = element_blank())+
  annotate(geom = "text",
           x=1,y=2,label="SV3_42936717",
           hjust=1.2,size=3,vjust=1)+
  annotate(geom = "text",
           x=1,y=1,label="SV3_42954617",
           hjust=1.2,size=3,vjust=0) -> p2
p2
image.png

将两个图组合到一起

library(ggpubr)
as_ggplot(get_legend(p2))
library(patchwork)

p1+
  annotation_custom(grob = get_legend(p2),
                    xmin=3.5,xmax=3.5,ymin=-28,ymax=-28)+
  p2+
  theme(legend.position ="none")+
  plot_layout(ncol = 1,heights = c(10,1)) -> p3
p3
image.png

最后是堆积柱形图的代码

数据集

image.png
dat02<-read_excel("data/20220711/41586_2022_4808_MOESM10_ESM.xlsx",
                  sheet = "Extend Fig7c")
dat02

dat02$x<-factor(dat02$x,
                levels = c("SNPs","Indels","SVs"))
dat02

dat02 %>% 
  group_by(x) %>% 
  mutate(new_col=cumsum(y)) -> dat02

ggplot(data=dat02,aes(x=x,y=y,fill=group))+
  geom_bar(stat="identity",
           position = "stack")+
  scale_fill_manual(values = c("Non-module"="#e99e9c",
                               "Module"="#98c0d7"))+
  geom_text(aes(x=x,y=new_col,label=y),
            vjust=1)+
  labs(x=NULL,y=TeX(r"(\textit{h}${^2}$)"))+
  theme_classic()+
  scale_y_continuous(expand = expansion(mult = c(0,0)))+
  theme(legend.position = c(0.2,0.8),
        legend.title = element_blank(),
        axis.title.y = element_text(angle = 0,vjust = 0.5)) -> p4
p4

image.png

最后是拼图

p3+p4
ggarrange(p3,p4,ncol = 2)
image.png

示例数据和代码可以自己到论文中获取,或者给本篇推文点赞,点击在看,然后留言获取

欢迎大家关注我的公众号

小明的数据分析笔记本

小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 160,881评论 4 368
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 68,052评论 1 301
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 110,598评论 0 250
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,407评论 0 217
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,823评论 3 294
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,872评论 1 224
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 32,037评论 2 317
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,778评论 0 204
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,505评论 1 247
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,745评论 2 253
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,233评论 1 264
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,568评论 3 260
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,231评论 3 241
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,141评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,939评论 0 201
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,954评论 2 283
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,784评论 2 275

推荐阅读更多精彩内容